Seimbas berkenaan dengan teknologi sintesis pertuturan Sintesis_pertuturan

Gambaran am sebuah sistem TTS tipikal

Sistem teks-ke-pertuturan (atau enjin) terdiri daripada dua bahagian: bahagian depan dan bahagian belakang. Umumnya, bahagian hadapan mengambil input dalam bentuk teks dan output wakil simbol linguistik. Bahagian belakang mengambil wakil simbol linguistik sebagai input dan menghasilkan gelombang ujaran buatan. Keaslian pensintesis pertuturan biasanya merujuk kepada berapa tepat bunyi output kedengaran seperti suara manusia sebenar.

Bahagian hadapan mempunyai dua tugas utama. Pertama, ia mengambil teks mentah dan menukar sebahagian daripadanya seperti nombor dan ringkasan kepada perkataan bertulis yang setara. Proses ini dikenali sebagai "penormalan teks" (text normalization), "prapemprosesan", atau "pembuatan token" (tokenization). Kemudian ia memberikan transkripsi fonetik kepada setiap perkataan, dan menandakan teks kepada pelbagai unit prosodi, seperti frasa, klausa, dan ayat. Proses pemberian transkripsi fonetik kepada perkataan ini dikenali sebagai "teks-ke-fonem" (text-to-phoneme, TTP) atau penukaran "grafem-ke-fonem" (grapheme-to-phoneme GTP). Gabungan transkripsi fonetik dan maklumat mengenai unit prosodi membentuk output wakil simbol linguistik pada bahagian hadapan.

Bahagian lain, bahagian belakang, mengambil wakil simbol linguistik dan menukarkannya kepada output bunyi sebenar. Bahagian belakang sering dirujuk sebagai "pensintesis". Teknik pensintesis yang berlainan dibincangkan di bawah.

Tolong bantu menterjemahkan sebahagian rencana ini.
Rencana ini memerlukan kemaskini dalam Bahasa Melayu piawai Dewan Bahasa dan Pustaka. Sila membantu, bahan-bahan boleh didapati di Sintesis pertuturan (Inggeris).
Jika anda ingin menilai rencana ini, anda mungkin mahu menyemak di terjemahan Google. Walau bagaimanapun, jangan menambah terjemahan automatik kepada rencana, kerana ini biasanya mempunyai kualiti yang sangat teruk.
Sumber-sumber bantuan: Pusat Rujukan Persuratan Melayu.